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Beschreibung 



Betriebsverf ahren eines automat ischen Spracherkenners zur 
sprecherunabhangigen Spracherkennung von Worten aus verschie 
5 denen Sprachen und automatischer Spracherkenner 

Die Erfindung betrifft ein Betriebsverf ahren eines automati- 
schen Spracherkenners zur sprecherunabhangigen Spracherken- 
nung von Worten aus verschiedenen Sprachen gemaB Patentan- 
10 spruch 1 und einen entsprechenden automat ischen Spracherken- 
ner gemaB Patentanspruch 6. 

Far die phonembasierte Spracherkennung ist ein Spracherken- 
nungs-Vokabular erf orderlich^ das die phonetischen Beschrei- 

15 bungen aller zu erkennender Worter \amfaBt. Dies ist eine 

Grundvoraussetzung fiir die phonembasierte Spracherkennung. 
Worter werden hierbei durch Phonemfolgen oder -ketten im Vo- 
kabular reprasentiert . wahrend eines Spracherkennungs-Vor- 
gangs wird eine Suche nach dem besten Pfad durch die Phonem- 

20 folgen im Vokabular durchgef tihrt • Diese Suche kann beispiels 
weise mit dem sogenannten Viterbi-Algorithmus erfolgen. Bei 
kontinuierlicher Spracherkennung kannen zudem die Wahrschein 
lichkeiten fttr Obergange zwischen W5rtern modelliert und in 
den Viterbi-Algorithmus einbezogen werden. 

25 

Die phonetischen Umschriften fur die zu erkennenden WOrter 
sind die Basis der phonembasierten Spracherkennung. Daher 
stellt sich zu Beginn des Einsatzes eines phonembasierten 
Spracherkenners immer die Frage, wie derartige phonetische 
30 Umschriften gewonnen werden konnen. Unter phonetischen Um- 
schriften werden hier die phonetischen Beschreibungen der 
Worter aus einem Zielvokabular verstanden. Insbesondere 
stellt sich diese Frage bei Wortern, die dem Spracherkenner 
nicht bekannt sind. 

35 

Bekannt sind Mobil- oder Schnurlostelef one, die eine spre- 
cherabhSngige Namenswahl ermOglichen. Ein Benutzer eines der 
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artigen Telefons muB hierzu die im elektronischen Telefonbuch 
des Telefons enthaltenen Eintrage trainieren, urn diese spater 
• zur Namenswahl per Sprache nutzen zu konnen. Allerdings kann 
in der Regel kein anderer Benutzer dieses Feature nutzen, da 
5 die sprecherabhangige Namenswahl nur far eine Person geeignet 
ist, namlich fiir diejenige, welche die Sprachwahl trainiert 
hat. Um dieses Problem zu umgehen, kOnnen die EintrSge im 
elektronischen Telefonbuch in phonetische Umschriften vrnige- 
wandelt werden. 

10 

Zum Ermitteln der phonetischen Umschrift aus einem geschrie- 
benen Wort, beispielsweise einem Telef onbucheintrag, sind un- 
terschiedliche Ansatze bekannt. Es sei hier beispielsweise 
auf die sogenannten Diktiersysteme, die im allgemeinen auf 

15 einem PC zur Ausfuhrung kommen, verwiesen. Bei derartigen 

Diktiersystemen ist im Normalfall ein Lexikon von typischer- 
weise mehreren 10000 Wortern mit den Zuordnungen von Buchsta- 
benfolgen zu Phonemfolgen hinterlegt. Da ein solches Lexikon 
allerdings einen sehr hohen Speicherplatzbedarf aufweist, ist 

20 es fur mobile Endgerate wie beispielsweise Mobil- oder 
Schnurlostelef one nicht praktikabel. 

Bekannt sind auch Systeme, bei denen die Umsetzung eines Wor- 
tes in dessen phonetische Umschrift regelbasiert oder durch 

25 speziell trainierte neuronale Netze erfolgt. Diese Verfahren 
besitzen wie das Lexikon den Nachteil, daii festgelegt werden 
mufi, in welcher Sprache die Phonemfolge realisiert werden 
soil. Allerdings kOnnen insbesondere in elektronischen Tele- 
fonbuchern Namen aus verschiedenen Sprachen vorhanden sein. 

30 Eine Umsetzung ware dann mit dem oben beschriebenen Verfahren 
nicht Oder nur unvollstSndig moglich. 

Daher wurden sogenannte multilinguale Systeme zur Phonemket- 
tenermittlung und Spracherkennung entworfen. Diese Systeme 
35 erlauben die Erzeugung von Phonemketten aus verschiedenen 
Sprachen. 
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10 



15 



20 



SchlieBlich existiert noch eine andere L5sung: Ein Benutzer 
spricht die Worte in ein Spracherkennungssystem ein, das dar- 
aus automatisch Phonemf olgen generiert. Bei groBen WortschSt- 
zen, aber auch schon bei einigen dutzend W5rtern, wie bei- 
spielsweise bei einem elektronischen Telefonbuch mit 80 Ein- 
tragen, ist dies fur den Benutzer nicht mehr akzeptabel. 

Aufgabe der vorliegenden Erfindung ist es daher, ein Be- 
triebsverfahrens eines automatischen Spracherkenners zur 
sprecherunabhangigen Spracherkennung von Worten aus verschie- 
denen Sprachen sowie einen entsprechenden automatischen 
Spracherkenner vorzuschlagen, welche einfach zu implementie- 
ren sind, sich insbesondere zum Einsatz in mobilen Endger^ten 
eignen, und kostengiinstig zu realisieren sind. 

Diese Aufgabe v/ird durch ein Betriebsverf ahren mit den Merk- 
malen des Patentanspruchs 1 und durch einen automatischen 
Spracherkenner rait den Merkmalen des Patentanspruchs 6 ge- 
lost . 



Der Erfindung liegt ira wesentlichen die Idee zugrunde, phone- 
tische Umschriften von Wortern jeweils fQr N-verschiedene 
Sprachen zu ermitteln, diese anschliefiend nachzuverarbeiten 
und einer phonembasierten einsprachigen Spracherkennung zuzu- 

25 ftthren- Diese Vorgehensweise beruht im wesentlichen auf der 
Erkenntnis, daB ein Benutzer der Spracherkennung normalerwei- 
se in seiner Muttersprache spricht. Auch f remdsprachige W6r- 
ter, beispielsweise Namen, spricht er normalerweise mit einer 
"MuttersprachenfSrbung", also einem Akzent aus, die bzw. der 

30 durch einen sogenannten Muttersprachen-Spracherkenner grob 

modelliert werden kann. Das Betriebsverf ahren geht daher von 
einer als Muttersprache definierten Sprache aus. 

Jede Sprache lafit sich nun mit unterschiedlichen, der jewei- 
35 ligen Sprache eigenen Phonemen beschreiben. Bekanntermaiien 

ahneln sich jedoch viele Phoneme verschiedener Sprachen. Ein 
Beispiel hierftir ist das "p" im englischen und deutschen. 
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Diese Tatsache wird bei der multilingualen Spracherkennung 
ausgenutzt. Fur ein Ensemble von Sprachen wird hier ein ein- 
ziges Hidden-Markov-Modell erstellt, mit dem simultan mehrere 
Sprachen erkannt werden kdnnen. Allerdings flihrt dies zu ei- 
5 nem sehr groBen Hidden-Markov-Modell, das eine niedrigere Er- 
kennungsrate als ein einsprachiges Hidden-Markov-Modell be- 
sitzt. Zudem muli bei einer Erweiterung des Ensembles von' 
Sprachen urn beispielsweise eine weitere Sprache ein neues 
Hidden-Markov-Modell erstellt werden. was sehr aufwendig ist. 
10 Dies wird mit der Erfindung vermieden. 

ErfindungsgemaB werden in einem ersten Schritt der Eingabe- 
phase zur Erstellung eines Spracherkenner-Vokabulars eines 
Betriebsverfahrens eines automatischen Spracherkenners zur 

15 sprecherunabhangigen Spracherkennung von Worten aus verschie- 
denen Sprachen, insbesondere von Erkennung von Namen aus ver- 
schiedenen Sprachen, die phonetischen Umschriften von Wortern 
jeweils far N-verschiedene Sprachen ermittelt, um pro Wort N- 
erste Phonemfolgen entsprechend N-ersten Aussprachevarianten 

20 zu erhalten. In einem zweiten Schritt werden die Ahnlichkei- 
ten zwischen den Sprachen ausgenutzt. Hierzu wird eine Abbil- 
dung der Phoneme jeder Sprache auf den jeweiligen Phonemsatz 
der Mutter sprache implement iert- Ferner wird in einem dritten 
Schritt die implementierte Abbildung auf die im ersten 

25 Schritt ermittelten N-ersten Phonemfolgen ftir jedes Wort an- 
gewandt. Dadurch werden pro Wort N-zweite Phonemfolgen ent- 
sprechend N-zweiten Aussprachevarianten erhalten. Mit dem 
Muttersprachen-Spracherkenner kann dann bereits eine Anzahl 
N-verschiedener Sprachen nach Erstellen eines Spracherkenner- 

30 Vokabulars mit den im vorhergehenden Schritt erhaltenenen N- 
zweiten Phonemfolgen pro Wort fur den Muttersprachen-Sprach- 
erkenner erkannt werden. 

Die Erfindung hat im wesentlichen die folgenden Vorteile: 
35 Wahrend ein Look-up-Verf ahren in einem Lexikon bei mobilen 
EndgerSten wegen des grolien Speicherplatzbedarf s scheitert 
und bei der multilingualen Spracherkennung, die ftir einen 
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Satz von Sprachen optimiert wurde, fiir jede neue Sprache neue 
Hidden-Markov-Modelle erstellt and optimiert werden mtissen, 
wird durch die Grapheme/ Phoneme-Konversion in mehrere Spra- 
chen gemali der Erf indung ein multilinguales System geschaf- 
fen, das mit relativ einfachen Mitteln zu implement ieren ist, 
sich daher vor allem zum Einsatz in mobilen Endgeraten eignet 
und nicht zuletzt kostengiinstig zu realisieren ist. Fiir die 
Erfindung ist neben der Graphem-zu-Phonem-Umwandlung im we- 
sentlichen nur noch ein Mapping, d. h. ein Abbilden zwischen 
den einzelnen Sprachen - wie oben erlSutert - erf orderlich. 
Die Phonemfolgen-Ermittlung und das anschliefiende Mapping 
bzw. Abbilden laufen normalerweise "offline" auf einem GerSt 
ab, beispielsweise einem Mobiltelef on, einem Personal Digital 
Assistant Oder Personal Computer mit entsprechender Software, 
und sind daher zeitunkritisch. Die hierfiir benStigten Res- 
sourcen kQnnen in einem langsamen externen Speicher unterge- 
bracht werden. 

Da das mit dem oben beschriebenen Verfahren erstellte Sprach- 
erkenner-Vokabular jedoch far jedes Wort N-Aussprachevarian- 
ten umfafit, ist der Suchaufwahd bei der Spracherkennung groB. 
Um ihn zu verringern, kann ein weiterer Schritt in das Ver- 
fahren eingeftihrt werden, der noch vor dem Erstellen des 
Spracherkenner-Vokabulars und nach dem Erzeugen der N-zweiten 
Phonemfolgen pro Wort ausgefiihrt wird. In diesem Schritt wer- 
den die N-zweiten Phonemfolgen entsprechend den N-zweiten 
Aussprachevarianten jedes Wort bearbeitet, indem jede zweite 
Phonemfolge mittels geeigneter Distanzen, insbesondere der 
Levenshtein-Distanz, analysiert und klassif iziert wird, und 
die N-zweiten Phonemfolgen jedes Wortes auf wenige, vorzugs- 
weise zwei bis drei, Phonemfolgen reduziert werden, insbeson- 
dere indem die Aussprachevarianten weggelassen werden, die 
der Ausspracheva riant e der Mutter sprache am wenigsten ahnlich 
sind. Vereinfacht ausgedrOckt werden durch diese Reduzierung 
die weniger wichtigen Aussprachevarianten weggelassen, wo- 
durch sich der Suchaufwand bei der Spracherkennung verrin- 
gert . 
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Eine weitere Aufwandsreduktion lafit sich erreichen, indem vor 
dem ersten Schritt eine Sprachidentif ikation und -reduktion 
vorgenommen wird. Im Rahmen dieser Sprachidentif ikation wird 
fiir jedes zu erkennende Wort die Wahrscheinlichkeit der Zuge- 
hSrigkeit zu jeder der N-verschiedenen Sprachen bestiinmt. An- 
hand des Ergebnisses dieser Sprachidentif ikation wird die An- 
zahl der im ersten Verfahrens schritt zu verarbeitenden Spra- 
chen, vorzugsweise auf zwei bis drei verschiedene Sprachen, 
reduziert. Diese Sprachreduktion erfolgt vorzugsweise, xndem 
die Sprachen mit der geringsten Wahrscheinlichkeit nicht wei- 
terverarbeitet werden. Far ein bestimmtes Wort kann das Er- 
gebnis der sprachidentifikation beispielsweise wie folgt lau- 
ten: "Deutsch 55%, UK-Englisch 16%, US-Englisch 14%, Schwe- 
disch 3%, Bereits nach diesem Ergebnis kann auf drei 
verschiedene Sprachen reduziert werden, indem Schwedisch weg- 
gelassen, d. h. nicht weiterverarbeitet wird. 

Das Ermitteln der phonetischen Umschriften im ersten Verfah- 
rensschritt erfolgt vorzugsweise durch mindestens ein neuro- 
nales Netz. Neuronale Netze haben sich zura Ermitteln phoneti- 
scher Umschriften aus geschriebenen Worten bewShrt, da sie 
gute Ergebnisse hinsichtlich der Genauigkeit und vor allem 
Verarbeitungsgeschwindigkeit liefern sowie einfach, insbeson- 
dere in Software implementierbar sind. 

Als Muttersprachen-Spracherkenner kann insbesondere ein Hid- 
den-Markov-Modell zum Einsatz kommen, das far die als Mutter- 
sprache definierte Sprache erstellt worden ist. 

Die Erfindung betrif ft ferner einen Spracherkenner zur spre- 
cherunabhangigen Spracherkennung von Worten aus verschiedenen 
Sprachen, insbesondere zur Erkennung von Namen aus verschie- 
denen Sprachen. Hierbei ist eine der verschiedenen Sprachen 
als Muttersprache definiert. Der Spracherkenner umfaBt 
- einen Muttersprachen-Spracherkenner, 
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- ein erstes Verarbeitungsmodul zum Ermitteln der phoneti- 
schen Umschriften von Wortern jeweils fUr N-verschiedene 
Sprachen, vm pro Wort N-erste Phonemf olgen entsprechend N- 
ersten Aussprachevarianten zu erhalten, 

5 - ein zweites Verarbeitungsmodul zxim Implementieren einer Ab- 
bildung der Phonem jeder Sprache auf dem jeweiligen Phonem- 
satz der Mutter sprache, 

- ein drittes Verarbeitungsmodul zum Anwenden der mit dem 
zweiten Verarbeitungsmodul implement iert en Abbildung auf die 

10 mit dem ersten Verarbeitungsmodul ermittelten N-ersten Pho- 
nemf olgen ftir jedes Wort, wodurch pro Wort N-zweite Phonem- 
folgen entsprechend N-zweiten Aussprachevarianten erhalten 
werden, die mit dem Mutter sprachen-Spracherkenner erkannt 
werden konnen und 

15 - ein viertes Verarbeitungsmodul zum Erstellen eines Sprach- 
erkenner-Vokabulars mit den durch das dritte Verarbeitungsmo 
dul erhaltenen N-zweiten Phonemf olgen pro Wort fur den Mut- 
tersprachen-Spracher kenner . 

20 In einer bevorzugten Ausf uhrungsf orm umfaBt der automatische 
Spracherkenner ein fUnftes Verarbeitungsmodul zum Bearbeiten 
der N-zweiten Phonemfolgen entsprechend den N-zweiten Aus- 
sprachevarianten jedes Wortes. Das fUnfte Verarbeitungsmodul 
ist derart ausgebildet, daB jede zweite Phonemf olge mittels 

25 geeigneter Distanzen, insbesondere der Levenshtein-Distanz, 
analysiert und klassif iziert wird, und die N-zweiten Phonem- 
folgen jedes Wortes auf wenige, vorzugsweise zwei bis drei, 
Phonemfolgen reduziert werden. 

30 Ferner kann der automatische Spracherkenner einen Sprachiden 
tifikator und einen Sprachreduzierer umfassen. Der Sprachi- 
dentifikator ist vor das erste Verarbeitungsmodul geschaltet 
und bestimmt fUr jedes zu erkennende Wort die Wahrscheinlich 
keit der Zugehorigkeit zu jeder der N-verschiedenen Sprachen 

35 Der Sprachreduzierer reduziert die Anzahl der vom ersten Ver 
arbeitungsmodul zu verarbeitenden Sprachen, vorzugsweise auf 
zwei bis drei verschiedene Sprachen, indem die Sprachen mit 
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der geringsten Wahrscheinlichkeit nicht weiterverarbeitet 
werden- Sprachidentif ikator und Sprachreduzierer verringern 
sowohl den Verarbeitungsaufwand des automatischen Spracher- 
kenners sowohl in der Eingabephase als auch in der Erken- 
5 nungsphase betrachtlich. 

Vorzugsweise weist das erste Verarbeitungsmodul mindestens 
ein neuronales Netz zum Ermitteln der phonetischen Umschrif- 
ten auf . 

10 

SchlieBlich weist der Muttersprachen-Spracherkenner in einer 
bevorzugten Ausfuhrungsf orm ein Hidden-Mar kov-Modell auf, das 
ftir die als Muttersprache definierte Sprache erstellt worden 
ist. 

15 

Vorteile und Zweckmaliigkeiten der Erfindung ergeben sich im 
Ubrigen aus der nachf olgenden Beschreibung eines Ausfuhrungs- 
beispiels der Erfindung anhand der einzigen Figur- Diese 
zeigt ein schematisches Ablauf diagramm der Eingabephase zur 
20 Erstellung eines Spracherkenner-Vokabulars gemSB der Erfin- 
dung, 

Es soil die sprecherabhangige Namenswahl auf einem Mobiltele- 
fon mit den Namen aus dem Telefonbuch far einen deutschspra- 

25 chigen Benutzer realisiert werden. In deiti Telefonbuch befin- 
den sich neben Qberwiegend deutschsprachigen Namen auch eini- 
ge f remdsprachige Namen. Ein Umsetzer fiir die graphemische 
Darstellung der Namen ist auf die Sprachen Deutsche Italie- 
nisch, Tschechich, Griechisch, Turkisch eingestellt, insge- 

30 samt als N = 5 verschiedene Sprachen, 

In einem Anf angsschritt SO wird eine Sprachidentif ikation der 
zugeftihrten Worte 10 bzw. Eintrage des Telefonbuchs vorgenom- 
men. Genauer gesagt wird jedes einzelne Wort auf die Wahr- 
35 scheinlichkeit der Zugehorigkeit zu einer der ftinf Sprachen 
analysiert. Wird beispielsweise ein deutscher Name verarbei- 
tet, so wird die Wahrscheinlichkeit fUr Deutsch sehr hoch 
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sein, fiir die anderen vier Sprachen, nSmlich Italienisch, 
Tschechisch, Griechisch und TUrkisch dagegen sehr viel nied- 
riger. Anhand der pro Wort ermittelten Wahrscheinlichkeiten 
wird die Sprache mit der geringsten Wahrscheinlichkeit fUr 
5 die weitere Verarbeitung weggelassen. Das bedeutet, dafi im 
nachfolgenden Verarbeitungsgang nur noch vier, anstatt fUnf 
Sprachen verarbeitet werden mUssen. 

In einem ersten Verf ahrensschritt SI wird ftlr jedes Wort die 
10 phonetische Umschrift fiir jede der vier verschiedenen Spra- 
chen ermittelt. Dadurch werden fiir jedes Wort vier Phonemfol- 
gen entsprechend vier ersten Aussprachevarianten erhalten. 

In einem zweiten Verf ahrensschritt S2 wird anschliefiend eine 
15 Abbildung der Phoneme jeder der vier Sprachen auf den jewei- 
ligen Phonemsatz der Muttersprache implementiert . 

Diese Abbildung wird in einem dritten Verf ahrensschritt S3 
auf die im ersten Verf ahrensschritt SI erhaltenen vier ersten 
20 Phonemfolgen 12 angewandt. Hierdurch werden fiir jedes Wort 
vier zweite Phonemfolgen 14 entsprechend vier zweiten Aus- 
sprachevarianten erhalten. Die vier zweiten Phonemfolgen 14 
kSnnen bereits mit einem Muttersprachen-Spracherkenner er- 
kannt werden. 

25 

Urn allerdings den Verarbeitungsaufwand ftir den Spracherkenner 
weiter zu reduzieren, wird pro Wort jede zweite Phonemfolge 
mittels der Levenshtein-Distanz analysiert und klassif iziert 
(Schritt S4) . Anschliefiend folgt ein fUnfter Verfahrens- 
30 schritt S5, in dem die analysierten und klassif izierten zwei- 
ten Phonemfolgen pro Wort auf drei Phonemfolgen reduziert 
werden . 



Schliefilich wird in einem letzten Schritt S6 ein Spracherken- 
35 ner-Vokabular mit dem in dem ftinften Verfahrensschritt S5 er- 
haltenen drei zweiten Phonemfolgen pro Wort fiir den Mutter- 
sprachen-Spracherkenner erstellt. Durch die nochmalige Reduk- 
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tion der Phonemf olgen im fiinften Verf ahrensschritt S5 wird 
also das zu speichernde und wahrend einer Spracherkennung zu 
durchsuchende Spracherkenner-Vokabular merklich reduziert. 
Dies bringt in einer praktischen Anwendung der Spracherken- 
5 nung einerseits den Vorteil eines geringeren Speicherplatzbe- 
darfs und andererseits einer schnelleren Verarbeitung, da ein 
kleineres Vokabular durchsucht werden muB . 

Nach Ablauf des beschriebenen Verfahrens kann der Benutzer 
10 mittels Spracherkennung eine Namenswahl^ also den sprachge- 
steuerten Aufruf gespeicherter Rufnummern tiber den Namen des 
Teilnehmers vornehmen, ohne dafi er den Namen des zu riifenden 
Teilnehmers explizit einmal vorsprechen, also trainieren, 
muB. 

15 

Im folgenden wird kurz erlautert, was der Benutzer des Mobil- 
telefons zur Verbesserung der Spracherkennung tun kann. Soil- 
te er einmal feststellen, daB ein bestimmter Name nicht gut 
erkannt wird^ kann er das Spracherkenner-Menu seines Mobilte- 

20 lefons aufruf en und dort die Anwendung "Namenswahl" auswSh- 
len. Unter dieser Anwendung kann ihm nun eine oder auch xneh- 
rere MSglichkeiten angeboten werden, um die Spracherkennung 
eines bestimmten Wortes, genauer gesagt eines bestimmten Na- 
mens aus dem elektronischen Telefonbuch des Mobiltelefons zu 

25 verbessern. Im folgenden werden beispielhaft einige dieser 
M5glichkeiten kurz erlSutert: 

1. Der Benutzer kann das schlecht oder gar nicht erkannte 
Wort nochmals in das Mobiltelefon einsprechen und anschlie- 

30 Bend durch den im Mobiltelefon enthaltenen Spracherkenner in 
eine Phonemf olge umsetzen lassen. In diesem Fall werden vor- 
her automatisch ermittelte Aussprachevarianten ganz oder 
teilweise, je nachdem welche Nahe sie zu der neu ermittelten 
Phonemfolge besitzen, aus dem Vokabular des Spracherkenners 

35 entfernt. 
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2. Alternativ kann sich der Benutzer auf dem Display des Mo- 
biltelefons eine Art Lautschrift des schlecht oder gar nicht 
erkannten Eintrags des elektronischen Telefonbuchs anzeigen 
lassen. Die Art Lautschrift kann der Benutzer dann bei Nicht- 

5 zutreffen, d. h, bei schlechter Obereinstimmung mit seiner 
Aussprache, editieren. Beispielsweise kann durch die automa- 
tische Umsetzung des Eintrags "Jacques Chirac" als Laut- 
schrift "Jakwes Schirack" gespeichert sein. Erscheint nun dem 
Benutzer diese Lautschrift als fehlerhaft, kann er sie init- 
io tels seines Mobiltelef ons editieren, beispielsweise zu 

"Schack Schirack", Anschlieliend kann das System dazu die pho- 
netische Beschreibung ermittelt und diese ins Spracherkenner- 
Vokabular neu aufnehmen. Damit sollte die automat ische 
Spracherkennung zuverlSssig funktionieren. 

15 

3. Schliefilich kann der Benutzer durch eine explizite Angabe 
der Sprache, aus der ein fehlerhaft oder gar nicht erkannter 
Name stammt oder durch explizite Auswahl einer bestimmten 
Sprache ftir einen bestimmten Namen die Erkennung wesentlich 

20 verbessern. In einem derartigen Fall werden alle Aussprache- 
varianten fur den Namen aus dem Spracherkenner-Vokabular ent- 
fernt/ die nicht der explizit angegeben Sprache zugeordnet 
sind. 

25 Die Erfindung kann auch vorteilhaft in anderen mobilen Gera- 
ten aufier einem Mobiltelef on z. B. einem Personal Assistant 
Oder auch einem Personal Computer verwendet, d. h- eingesetzt 
werden. 
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PatentansprUche 

1. Betriebsverfahren eines automat ischen Spracherkenners zur 
sprecherunabhangigen Spracherkennung von Worten (10) aus ver- 

5 schiedenen Sprachen, insbesondere zur Erkennung von Namen aus 
verschiedenen Sprachen. das von einer als Muttersprache defi- 
nierten Sprache ausgeht und eine Eingabephase zur Erstellung 
eines Spracherkenner-Vokabulars mit den folgenden Schritte 
aufweist: 

10 (a) Ermitteln der phonet ischen Umschriften von Wort em je- 
weils ftir N verschiedene Sprachen, urn pro Wort N erste Pho- 
nemfolgen (12) entsprechend N ersten Aussprachevarianten zu 
erhalten (Si) , 

(b) Implement ieren einer Abbildung der Phoneme jeder Sprache 
15 auf den jeweiligen Phonemsatz der Muttersprache (S2) , 

(cl) Anwenden der in Schritt (b) implementierten Abbildung 
auf die in Schritt (a) ermittelten N ersten Phonemfolgen (12) 
fur jedes Wort, wodurch pro Wort N zwei'te Phonemfolgen (14) 
entsprechend N zweiten Aussprachevarianten erhalten werden, 
20 die mit einem Muttersprachen-Spracherkenner erkannt werden 
kGnnen (S3), und 

(d) Erstellen eines Spracherkenner-Vorkabulars mit den im 
vorhergehenden Schritt erhaltenen N zweiten Phonemfolgen pro 
Wort far den Muttersprachen-Spracherkenner (S6) . 

25 

2. Betriebsverfahren nach Anspruch 1, 

ferner gekennzeichnet durch die folgenden, vor dem Schritt 
(d) und nach dem Schritt (cl) auszuf Qhrenden Schritte: 
(c2) Bearbeiten der N zweiten Phonemfolgen (14) entsprechend 
30 den N zweiten Aussprachevarianten jedes Wortes, indem 

(c21) jede zweite Phonemfolge (14) mittels geeigneter Distan- 
zen, insbesondere der Levenshtein-Distanz, analysiert und 
klassifiziert wird (S4), und 

(c22) die N zweiten Phonemfolgen jedes Wortes auf wenige, 
35 vorzugsweise 2 bis 3, Phonemfolgen reduziert werden (S5) . 
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3. Betriebsverfahren nach Anspruch 1 oder 2, 
dadurch gekennzeichnet, dass 

vor deiti Schritt (a) eine Sprachidentif ikation vorgenonimen 
wird, durch die ftir jedes zu erkennende Wort die Wahrschein- 
5 lichkeit der ZugehOrigkeit zu jeder der N verschiedenen Spra 
Chen bestimmt wird, und anhand des Ergebnisses der Sprach- 
identif ikation die Anzahl der in Schritt (a) zu verarbeiten- 
den Sprachen, vorzugsweise auf 2 bis 3 verschiedene Sprachen 
reduziert werden, indem die Sprachen mit der geringsten Wahr 
10 scheinlichkeit nicht weiter verarbeitet werden (SO) . 

4. Betriebsverfahren nach einem der Anspruche 1 bis 3, 
dadurch gekennzeichnet , dass 

das Ermitteln der phonetischen Umschriften in Schritt (a) 
15 durch mindestens ein neuronales Netz erfolgt. 

5. Betriebsverfahren nach einem der Anspruche 1 bis 4, 
dadurch gekennzeichnet , dass 

als Muttersprachen-Spracherkenner ein Hidden-Markov-Modell 
20 eingesetzt wird, das fUr die als Mutter sprache definierte 
Sprache erstellt worden ist. 

6- Automatischer Spracherkenner zur sprecherunabhSngigen 
Spracherkennung von Worten aus verschiedenen Sprachen, insbe 
25 sondere zur Erkennung von Namen aus verschiedenen Sprachen, 
wobei eine der verschiedenen Sprachen als Muttersprache defi 
niert ist, mit 

- einem Mutter sprachen-Spracherkenner, 

- einem ersten Verarbeitungsmodul zum Ermitteln der phoneti- 
30 schen Umschriften von Wortern jeweils ftir N verschiedene 

Sprachen, um pro Wort N erste Phonemfolgen entsprechend N 
ersten Aussprachevarianten zu erhalten, 

- einem zweiten Verarbeitungsmodul zum Implementieren einer 
Abbildung der Phoneme jeder Sprache auf den jeweiligen Pho- 

35 nemsatz der Muttersprache, 

- einem dritten Verarbeitungsmodul zum Anwenden der mit dem 
zweiten Verarbeitungsmodul implementierten Abbildung auf die 
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10 



20 



mit dem ersten Verarbeitungsmodul ermittelten N ersten Pho- 
nemfolgen far jedes Wort, wodurch pro Wort N zweite Phonem- 
folgen entsprechend N zweiten Aussprachevarianten erhalten 
werden, die mit dem Muttersprachen-Spracherkenner erkannt 
we r den kfinneri/ und 

- einem vierten Verarbeitungsmodul zum Erstellen eines 
Spracherkenner-Vorkabulars mit den durch dasdritte Verarbei- 
tungsmodul erhaltenen N zweiten Phonemfolgen pro Wort fur den 
Muttersprachen-Spracherkenner . 



7. Automatischer Spracherkenner nach Anspruch S, 
gekennzeichnet durch 

ein funftes Verarbeitungsmodul zum Bearbeiten der N zweiten 
Phonemfolgen entsprechend den N zweiten Aussprachevarianten 
15 jedes Wortes, das derart ausgebildet ist, dass jede zweite 
Phonemfolge mittels geeigneter Distanzen, insbesondere der 
Levenshtein-Distanz, analysiert und klassif iziert wird, und 
die N zweiten Phonemfolgen jedes Wortes auf wenige, vorzugs- 
weise 2 bis 3, Phonemfolgen reduziert werden. 



8. Automatischer Spracherkenner nach Anspruch 6 oder 1, 
gekennzeichnet durch 

einen Sprachidentif ikator, der vor das erste Verarbeitungsmo- 
dul geschaltet ist und fur jedes zu erkennende Wort die Wahr- 

25 scheinlichkeit der Zugeh5rigkeit zu jeder der N verschiedenen 
Sprachen bestimmt, und einen Sprachreduzierer^ der die Anzahl 
der vom ersten Verarbeitungsmodul zu verarbeitenden Sprachen, 
vorzugsweise auf 2 bis 3 verschiedene Sprachen, reduziert 
werden, indem die Sprachen mit der geringsten Wahrscheinlich- 

30 keit nicht weiter verarbeitet werden. 

9. Automatischer Spracherkenner nach einem der Ansprtiche 6 
bis 8, 

dadurch gekennzeichnet, dass 
35 das erste Verarbeitungsmodul mindestens ein neuronales Netz 
zum Ermitteln der phonetischen Umschriften aufweist- 
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10. Automatischer Spracherkenner nach einem der AnsprUche 6 
bis 9, 

dadurch gekennzeichnet / dass 

der Muttersprachen-Spracherkenner ein Hidden-Markov-Modell 
5 aufvreist, das far die als Muttersprache definierte Sprache 
erstellt worden ist. 

11. Verwendung des Betriebsverf ahrens nach einem der AnsprU- 
che 1 bis 5 und des automatischen Spracherkenners nach einem 

10 der Anspruche 6 bis 10 in einem mobilen Gerat wie einem Mo- 
biltelefon. Personal Digital Assistant oder einem Personal 
Computer. 
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